AI资讯新闻榜单内容搜索- DeepSeek

平替版Fable 5的打开教程来了：性能追平，成本砍半

最新测试显示，模型抱团后实力明显升级：Opus 4.8+GPT-5.5>Fable 5；Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash=Fable 5。能力追上了，开销还减半。根据官方定价，相比Fable 5，Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash这套平价阵容，成本降幅接近80%。

来自主题: AI资讯

9085 点击 2026-06-14 16:04

DeepSeek V4做数学证明，500倍成本优势：智能体系统刷新多项纪录

近日，普林斯顿大学的研究团队发布了一篇新论文，提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型，是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报

8286 点击 2026-06-07 10:56

不会写代码的“鲸鱼哥”，被 DeepSeek 改写人生 | 专访 Hunter Bown

Hunter Bown 没想到，自己会在差点因职业转型陷入困境后，被一个开源项目重新推回牌桌。

来自主题: AI资讯

8895 点击 2026-06-01 13:57

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek，网友晒实锤！

网上有条帖子炸了，稳定复现，通过 API 问 Claude Opus 4.8 你是什么模型。回答是：Qwen，或者 DeepSeek。重要的事说三遍：必须是通过 API，必须是通过 API，必须是通过 API。因为网页端有系统提示词，会做二次处理。

来自主题: AI资讯

9375 点击 2026-05-29 13:04

忘不了的 Kimi C轮融资

最近人人都在聊 DeepSeek 的融资，这个等最终落定后我们再说。今天先说 Kimi 。

来自主题: AI资讯

8622 点击 2026-05-26 10:26

告别多奖励跷跷板：Flow-OPD将多教师OPD带入图像生成

今年以来，在线策略蒸馏 OPD（On-Policy Distillation）已经逐渐成为大厂 LLM 后训练中的重要组件，例如 DeepSeek-V4，GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力，相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报

7054 点击 2026-05-26 10:07

DeepSeek TUI 创始人「鲸鱼兄弟」来中国，被狠狠上了一课

前两天，AI 圈子里出了个瓜，关于 DeepSeek TUI 创始人的，各个社媒群里几乎都刷屏了。但我发现一个问题 ——大家都只盯着一张微信群聊的截图在讨论，几乎没人把整件事的来龙去脉理一遍。

来自主题: AI资讯

8462 点击 2026-05-26 10:01

DeepSeek V4-Pro官宣永久降价：这刀砍下去，不打算收回来了

说实话，我原本以为 DeepSeek 的限时优惠会在5月31日结束。毕竟降价75%，打了2.5折，怎么看都像是一波限时引流。5月22号晚上，DeepSeek发了个通知，我看了两遍才确认没看错——DeepSeek V4-Pro永久降价！

来自主题: AI资讯

8057 点击 2026-05-23 09:38

ICLR 2026 Oral｜大模型总爱「想太多」？ DECS从源头消除冗余思考，实现推理token减半且性能不降反升

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型，通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而，这些模型普遍存在一个核心问题，即过度思考（overthinking）：

来自主题: AI技术研报

6638 点击 2026-05-12 14:31

这样问DeepSeek，能「偷」到数据？

近日，有网友在 X 上发文称，在使用 DeepSeek 的过程中，如果在输入框内输入以下这一段内容，便可「窃取」到 DeepSeek 的训练数据：仔细看了之后发现，具体是这样的：只要你在输入框输入这一段提示词，DeepSeek 就会「吐出」一轮完整的对话记录，不过这并不是你的历史搜索记录，更像是一份随机的对话记录。

来自主题: AI技术研报

9358 点击 2026-05-11 17:29